隐私计算最后的突破,是通用隐私计算技术的出现? | 零壹读书会04期
来源 | 零壹财经
编辑 | 楚济慈
脱离数据安全谈数字经济的发展是虚妄的,且不能高效流通数据的数字经济是僵死的。安全与流通,两者的平衡,仅仅通过制度规定还不足以实现。技术发展带来的问题,还是要靠技术来解决。
在此背景下,隐私计算被寄予厚望。所谓隐私计算,是指在保护数据本身不对外泄的前提下实现数据分析计算的技术集合,达到数据“可用不可见”的目的,在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。
2023年4月9日,“零壹读书会04期:《隐私计算:数字经济新基建》”在北京举办,中国精算师协会会长、数字保险智库学术委员会主席王和,全联并购公会信用委副主任、北京信用学会副会长刘新海,洞见科技创始人、董事长姚明,锘崴科技合伙人、医疗大健康事业部总经理吴凡,零壹智库CEO柏亮围绕书籍共同探讨了隐私计算在数字经济时代的发展、应用、创新和趋势。
01
隐私计算:为数字经济的下一程构建基石
隐私计算的技术从上世纪七八十年代提出概念,通过不断的探索,最近一两年进入到了具有实践功能、产生商业价值的状态。一大批隐私计算公司在这个过程中崛起,对于数字经济的发展起到非常重要的作用。
2021年初,零壹智库开始重点关注隐私计算,组织团队和专家进行调研,并得到行业头部公司的支持。零壹智库调研了几十家公司,也做了相关的行业数据库,在这个基础上做了大量的研究之后,推出了书籍《隐私计算:数字经济新基建》。
《隐私计算:数字经济新基建》一书对隐私计算的源流,产业的发展,大型的互联网公司、技术公司的布局,以及新兴创业公司的成长、创业投资、商业模式都做了非常细致的探索。该书由零壹智库出品,中译出版社出版,香港科技大学数字金融实验室、中国科技体制改革研究会数字经济发展研究小组提供学术支持,蚂蚁集团、盾科技、蓝象智联、洞见科技、富数科技、锘崴科技、同态科技提供研究支持。
1、隐私计算市场还在发展初期,渗透率有待提高
《隐私计算:数字经济新基建》显示,隐私计算已经形成了三大技术流派,即密码学、可信硬件和联邦学习。以密码学为核心技术的隐私计算以多方安全计算、同态加密为代表;可信硬件以可信执行环境(TEE)为主导;联邦学习类泛指国内外衍生出的联邦计算、共享学习、知识联邦等一系列名词,是指多个参与方联合数据源、共同建模、提升模型性能和输出结果准确性的分布式机器学习。
目前,隐私计算已经形成了气候,从概念到落地应用,成为当前治理数据安全的主要工具。
从行业发展成熟度来看,在国内,2021 年隐私计算技术开始商业应用,2022 年隐私计算产品的标准化程度大大提高,应用落地开始加速。除了在金融、医疗、政务等常见领域,一些公司还探索隐私计算技术在电网、审计、出行、酒店、民航、招聘等场景中的应用。
同时,隐私计算已是一个快速成长的产业,形成了几股势力,比如:
(1)几大流派的学术和技术团队都分别培育出了自己的创新企业团队,其中相当一部分企业获得了风险资本的投资,目前成长速度较快;
(2)BigTech凭借自己的技术、资金和场景优势,开展隐私计算的研发和业务,有的公司同时开展不同流派的隐私计算技术探索;
(3)“集成商”,将隐私技术与现有的软件、硬件、数据服务等嫁接或集成,植入到服务中。
但是,总体而言,市场发展仍然处于初期,技术的成熟度、便利度还有待提高,成本有待下降。目前,主要是头部的金融机构、较发达地区的政府机构、少量的医疗机构落地了隐私计算应用,在其他领域隐私计算也有零星的落地。隐私计算业务或公司大多还在融资、亏钱,实现规模性盈利的不多。隐私计算公司的融资,也大多还在B轮或B轮以前的早期阶段。
从业务普及度和政策定位来看,隐私计算作为“新基建”的地位还没有得到足够认可。数据安全已经成为“国之重器”,隐私计算也在一些产业政策文件中屡被提及,而作为数字经济新型基础设施的地位,需要更广泛的实践来锤炼、更有力的政策法规来推动。
2、展望:隐私计算更实用,内外融合同步加强
毋庸置疑,隐私计算的产业应用、市场规模在逐渐扩大,对数字经济发展产生的效应也会越来越强,它和政策之间是相互呼应的。在这些基础上,零壹做了一些简单的展望:
第一,实用性进一步提升。
2021-2022年,隐私计算在商用中不断打磨,通过提升性能、加强互联互通、开源等方式,为性价比的大幅提升积累了条件:性能提升将直接降低用户的单位成本和总成本,互联互通解除了重复建设、沟通协调的成本,而开源则降低进入门槛和人力成本。如互联互通在过去两年已完成初步尝试,2023年会持续加深并且形成一些真正可落地的标准。
第二,“内外融合”同步加强。
无论是隐私计算各种技术流派之间的“内部融合”,还是与其他数字技术的“外部融合”,速度都将加快。比如,隐私计算与人工智能、区块链、工业互联网等技术的融合,与硬件的结合(已产生多款一体机等软硬件结合产品)。这种融合,不是简单的加法,而是乘法,促生新的解决方案,乃至新的商业模式。
第三,在数据要素市场建设中融入各种场景。
头部数据交易所已经开始运用区块链+隐私计算等关键技术,建设新型数据交易信息化平台,实现“数据可用不可见,用途可控可计量,流通可信可追溯”。北京国际大数据交易所、杭州国际数字交易中心、贵阳大数据交易所等,纷纷采用了区块链+隐私计算的技术架构。
随着市场发展,参与交易和服务的相关主体也需要应用隐私计算。作为基础型的要素市场,其辐射面之广,涉及主体之多,非当前所能估计,这也意味着隐私计算的将随着数据要素市场的发展而融入各种场景并逐步普及。
第四,融入数据安全和数据治理之中。
隐私计算作为数据安全和数据治理的工具,将在数据市场、数据产业的发展过程中以各种形式被纷纭的市场主体采用。2023年1月中旬,工业和信息化部、国家网信办、发展改革委等十六部门印发《关于促进数据安全产业发展的指导意见》,提出加强隐私计算、数据流转分析等关键技术攻关;加强数据质量评估、隐私计算等产品研发;推进安全多方计算、联邦学习、全同态加密等数据开发利用支撑技术的部署应用。
02
观点激荡:“隐”跟“隐私保护”,永远是一场博弈
1、王和:隐私计算不是一个单纯的技术概念,别把所有的宝都押在技术上
中国精算师协会会长、数字保险智库学术委员会主席王和:应从底层结构和社会治理的视角来探讨隐私计算的逻辑、价值和意义。
王和认为:本书将隐私计算定位为“新基建”,这是一个非常准确、正确和务实的提法。一是隐私计算是未来数字经济发展的重要基础设施;二是目前隐私计算仍处于初级阶段,需要“大兴基建”,将隐私计算能力打造成为数字经济的基础设施。同时 ,王和特别提出隐私计算不仅是一个技术概念,更是一个文化和治理层面的概念,即它是基于社会对隐私的尊重和保护基础上的,它将给人类社会带来根本性的影响,这是所有,特别是从事技术的人员应该意识并重视的。
王和说,今天我们大家都接受了一个概念叫“万物皆数”,即我们处于数字化时代和数字化世界,也就是说,世界是由“数”构成的,“数”是世界的基本单元,当你把“数”搞清楚了,你就把这个世界搞清楚了。科技是实现数字化的手段,赋予了我们认识世界、解释世界、理解世界和利用世界以全新的可能,这是时代给我们的一个巨大的机遇,或者说福利。
从这个角度看,“私”,或者“隐私”是相对的。如果说世界是由“数”构成的,当你拥有足够多的“数”时,这个世界将“无私可隐”。王和说:“可以说,如果你给我足够的数据、算力和有效的算法,我就可以告诉你这个世界的真相”。那么,隐私计算该如何成立?王和认为,“隐”是相对的。中国人常讲一句话叫“大隐隐于市”,有的时候,隐私不是绝对的隐,只是“如何隐”,即如何从技术和效果的视角去实现“隐”的效果和目的。
他说,我们不得不面对一个非常客观的现实,那就是:随着技术的发展,“隐”与“私”之间永远是一场博弈,而客观来讲,它们永远是一种相对的,一种此消彼长的关系。所以,从某种程度上讲,就“隐私”而言,不是“能不能”,而是“该不该”的问题,这需要全社会的集体共识。
王和提醒:企业,特别是金融企业一定要有一种意识:安全技术永远是相对有限的,没有绝对的安全,也没有绝对的隐私。另外,安全技术不能单打独斗,真正的安全需要全面和综合治理,特别是全员的安全文化和制度建设,有效和切实解决隐私保护和信息安全的问题。
2、刘新海:商业隐私需通过加密,才能跟ChatGPT进行交互
全联并购公会信用委副主任、北京信用学会副会长刘新海表示,在数据要素市场时代,数据资产的特点跟过去不太一样,其中还包括安全、个人隐私等问题。如何在社会大众以及公司之间建立起信任关系,是隐私计算出现的契机。他认为,隐私计算的未来还会再继续“丰富”。
刘新海说,隐私计算有非常庞大的市场需求。目前,在国内数据要素市场建设过程中,面临的最重要的问题就是数据不流通,形成各种各样的数据孤岛。数据流通不畅,最根本的原因是没有良好、有效的制度和技术手段。
我国构建个人信息保护这个围栏的时间非常短,而且是急刹车。相比GDPR(欧盟通用数据保护条例),国内个人信息保护具有一定的后发优势,吸收了很多优秀的个人信息保护理念,但毕竟没有像欧美那样经历几十年的建设,因此本质上缺乏很多手段。比如,粤港澳大湾区经济已经一体化,但数据仍没有实现一体化。刘新海认为,原因在于底层的基础设施不够,因此书籍副标题提的很好:“数字经济新基建”。
此外,刘新海特别提到征信领域和AI领域。
在征信领域,中国面临着两大问题,一个和国内发展阶段有关的问题,另一个是现实迫切问题。前者是指中国由于信息产业起步较晚,发展时间短,没有行程欧美发达市场经济国家那样的土壤——会有消费者维权组织等各方盯着消费者个人数据权益保护以及个人数据保护多方博弈;正因为国内还缺乏这种个人信息保护深入人心的意识,因此需要在技术和制度上发挥后发优势,例如充分利用隐私计算技术解决这些数字经济时代的基本民生问题。
第二个问题非常迫切,最近金融领域的一件大事就是征信数据的断直连,为什么断直连?原因是过去互联网金融、消费金融较热的时候,国内征信服务跟不上,就涌现了很多大数据、金融科技公司都在进行个人信用信息服务,即实际上的征信服务。这些公司的数据不受监管,个人隐私、网络信息安全情况无法保证,因此在目前全球个人数据强监管的形势下,推出了“断直连”的监管举措。但是,如果可以通过隐私计算搭建一个很好的基础设施,数据在可信任的环境中传输和应用,个人信息保护和网络信息安全的问题就能解决。
在AI领域,现在有人警告,不能把公司的秘密“喂”给ChatGPT,不然它在回答问题时就反馈出来了。刘新海认为,未来,商业隐私也需要通过加密的方法,跟ChatGPT这类大模型进行交互。
最后,刘新海提到隐私计算所面临的的挑战也非常大,比如目前成本太高,当然,隐私计算如果能够在通用性上解决很多问题,在成本优化上完全是可行的,但目前还存在很多挑战。另外,隐私计算跟具体领域的结合,还需要大量的研发才能支撑。
3、姚明谈隐私计算应用:多层级、多领域的密态数据计算网络正在形成
作为隐私计算行业的领先代表厂商,洞见科技对隐私计算技术的探索始于2017年,在全球著名科学家、斯坦福终生教授张首晟先生的指导下,开展数据安全与隐私保护技术研究。此后,伴随着隐私计算商业化进程,洞见科技积极牵头并参与了多项隐私计算行业关键标准的制定,目前为止已包含70多项标准,30多项研究报告。
洞见科技创始人、董事长姚明表示,隐私计算行业产生的大背景是市场对数据有强烈需求,因此数据商业价值近年来逐渐凸显是隐私计算行业诞生发展的根基。同时,数据必须经过开放和流通才能充分释放价值,而开放过程中则不可避免地涉及到数据安全和隐私保护的问题。另外,数据不同于土地、劳动力等传统生产资料,并没有独占性,其流通开放是以“可复制”为代价,这就意味着他人在获取数据后,如果缺乏必要的安全流通手段,那么就会面临数据价值贬值、用法用量失控等后链路风险。
姚明介绍,从数据流通技术的发展阶段来看,从文件传输、接口调用再到可信沙箱,其原始数据都会脱离控制域,不能够完全避免数据安全和隐私泄露的风险。直到隐私计算这项技术的出现,才能真正让“原始数据不出域,数据可用不可见”。所以说,隐私计算技术对数据流通带来了一次范式变革,“明文的数据盛宴结束了,密文的数据时代已开启”。
但从数据处理的角度来说,目前,这四类技术并非彼此取代的关系,而是同时存在,根据数据具体类型及安全需要灵活选用。一般来说,对低敏感度的数据流通我们会使用数据文件、数据接口,对中等敏感度的数据,有可能还会使用数据沙箱,只有对高敏感度数据,对安全和隐私更加注重,才会使用隐私计算。
从发展趋势来说,既然新的范式已产生,所有的数据流通一定会沿着这条路径朝着最先进、最合理的范式去升级。《隐私计算:数字经济新基建》中提到的一些行业政策,我们从中会看到一条时间线,即隐私计算技术的政策法规,基本上都是从2021年下半年开始密集出台。业内热议的“数据二十条”,再次将“原始数据不出域,数据可用不可见”作为一个重点,给大家划定了一条红线。
从商业化视角来看,目前行业领域里应用最广泛或者是商业化落地最多的三大领域是金融、政务和通信。隐私计算所服务的客户包括两大类:即数据提供方和应用方。姚明认为,隐私计算行业的发展预期,是在数据供给侧和数据应用侧都完成基础设施建设,形成密态数据计算网络,进而才能达成大规模化场景应用。
4、吴凡解读隐私计算落地场景:医疗行业难度高、价值大
锘崴科技合伙人、医疗大健康事业部总经理吴凡表示,在隐私计算落地的行业中,金融、政务领域占据较大比例,医疗领域占比较少。不过,《隐私计算:数字经济新基建》留了较大篇幅去介绍医疗板块,原因在于隐私计算在医疗场景的落地非常难,同时价值也非常大。
吴凡称,医疗行业本身门槛非常高,需要非常强的专业性。举个例子,十多年前,他在微软研究院做机器人视觉识别,让机器人去认识日常生活中的所有东西,其中有一个数据处理的环节叫做“打标签”,比如“什么是小猫”,要先由人工打标签,再让机器辨认。这一环节是所有数据治理、人工智能必经的环节,但是在医疗领域打标签的工作只有专业医生能干,什么是冠心病、甲亢,需要根据各种各样的医学评测、检测的结果才能做出判断。所以即便最简单的打标签环节,医疗行业的专业门槛都非常高,更不用说后面的诸多环节。
此外还有数据结构化的难点。在其他行业数据结构化通常做的很好,特别是金融行业,因为涉及金钱所以结构化做的非常好,但是医疗行业数据结构化做的较差,行业非结构化和多元异构数据的现象非常严重。
再举个例子,在雾霾最严重的几年,微软研究院做了环保相关的APP,该APP采集的数据非常简单,主要为二氧化硫、二氧化氮、PM2.5、PM10......很容易就能把数据收集齐,开展人工智能分析。但是在医疗行业,已知的疾病已有两万种,每一种疾病向下延伸都是一个子行业,所有的诊疗、用药、诊断、康复数据都不同,可想而知其复杂程度。传统的医疗数据治理都这么难,更别论在此基础上做隐私计算。
吴凡表示,医疗数据风险高,价值更高。医疗切切实实关系到每个人最隐私的东西,医疗科研的落脚点就是把病治好、把药物研发出来。医疗数据包含数据深度和数据宽度。数据深度是指将某一种疾病往下钻,将疾病研究的清楚明白,这在一个医院就可以做好,现在医疗行业有很多产品叫专病库,包括数据治理、大数据平台,其实都是针对单个医院。在单个医院里可以把数据深度研究明白,但解决不了数据宽度的问题。中国地大物博,每个省的常见病、不同海拔维度的地方病都不同,所以要想在国内把医疗大数据搞好,一定要横向连接不同医院的数据,最终形成一个全貌。
吴凡说,医疗数据的高价值体现在,可以通过医疗大数据去降低药物研发成本,提升药物研发概率。应运而生的隐私计算技术,可以真正地打通不同区域的大数据。隐私计算技术是一个大的技术框架,不同的技术路线各有优缺点,在实际应用中就需要结合不同的技术路径的优势,同时结合不同场景对于安全性系统评估的要求,通过融合的解决方案,去适应多元化产品的需求。这就像盖一座大楼,要在大楼最重要的地方选择一些硬度、强度比较大的材料,比如同态加密,在其他的地方选择相对轻便、敏捷的方法,以达到全局性能、效率和精度的最优解。
03
现场交流:隐私计算九问
1、多中心节点的前提下,使用不同的隐私计算平台,会影响互联互通吗?
姚明:肯定有影响。在没开源的前提之下,隐私计算公司对于数据的处理机制、计算的协议其实都是黑盒状态,这也正是互联互通技术标准建立的初衷。从约束性角度来说,未来,相关标准应该会约束其他隐私计算厂商,对于新进入隐私计算赛道的一些创业公司,在做自己的平台算法和架构时,也一定会参考互联互通的技术标准。
从商业化落地角度来看,确实有一些客户构建了自己的互联互通平台,它可能是一个数据应用方,和它所提供数据的机构使用不同的隐私计算平台。这时,需要建立互联互通的底座,包括去做互联互通实质性的交互开发,这已成为现在商业化的常态。洞见科技的一些银行客户,包括通信运营商客户都在做这样的事情。
从影响的方面来说,第一、技术的复杂度肯定会增加。标准虽然建立了,但是需要适配这个标准,然后对于自身的技术体系做出一些规范和调整是必不可少的。第二、这种互联互通的技术体系本身不同于开源。如果开源的话,大家很容易就互联互通了,目前我们所有谈到的互联互通是指至少有一方是闭源状态。对于闭源的互联互通,势必会涉及到算法的可信和互通协议的安全问题。从技术上来说,我们需要不断地去优化和迭代这套标准体系,让连接的多方能更容易建立信任,更容易评估平台互联互通之后的安全性。
2、互联互通,医疗领域会更难吗?
吴凡:举个简单例子,目前很多医院应用的医院信息系统HIS,以及电子病历和患者主索引软件EMR,这两种软件都存储了患者信息、医生的诊疗诊断信息等。在美国做这类软件的厂商只有三四家,这意味着只要这三四家的接口打通就可以互联了,但在中国这类厂商有三四百家,要把所有接口都打通非常困难。
不过,经过十多年的发展,目前医疗领域数据互联互通已经有了很好的进展。原因在于我国要求电子病历标准化,医院和区域互联互通已经做了很多年。目前的状况是,相比十年前明显看到了很多进展,但是仍然没有办法做到畅通无阻的互联互通。所以一方面需要用新的技术去打通,另一方面需要在法律法规层面来解决。
3、信创产品用了飞腾的CPU、麒麟的操作系统、达摩的数据库,这是否是一个可信的环境?国外像英特尔、AMD、ARM等都有自己的TEE(可信执行环境),这两者有何区别?
吴凡:这两种一个可以理解为广义的可信执行环境,另一种则是狭义的可信执行环境。
广义的可信执行环境就是大的信创范畴,包含数据库、服务器、各种各样的服务器操作系统等等来达到可信。狭义的可信执行环境,比如英特尔的SGX,是真正的可信执行环境。TEE是一种单独的技术,是在计算平台上以软硬件方法构建的一个安全区域,保证在安全区域内加载的代码和数据在机密性和完整性方面得到保护。
广义、狭义这两者不冲突,未来在整个大的信创范畴内,也会应用到隐私保护计算的可信执行环境。锘崴科技推出的锘崴信®隐私保护计算一体机,目前除了可以支持英特尔的SGX,包括ARM架构,还可以支持信创产品,如国内的飞腾、海光、鲲鹏都可以支持,相当于我们用了这样一个可信执行环境技术,适配了信创大场景下的每一个参与方。
4、政府数据开放的效果如何?在数据要素市场产生经济价值了吗?
姚明:政府数据开放和商业化数据开放有着本质的差异。对于政府数据开放来说,商业变现不是主要诉求,更多还是促进社会公益和赋能实体经济发展。同时,政府数据开放,是在分类分级标准指引下的逐步开放。从2021年开始,已有一些政府数据基于隐私计算开放的商业案例真正落地。不过,各地方政府数据底层基础设施的完备程度不同,分类分级标准也并不完全统一,所以也会导致各地政府数据目录有比较大的差异。
目前,对于这类纯粹的公共数据开放,障碍是最小的。比如说一些环保的信息、治理的信息、统计类信息或者群体类信息开放,几乎没有什么障碍。阻力比较大的是涉及主体信息的数据开放,不管是以个人为主体还是以企业为主体,这类数据往往价值更大、更直观,从风险角度来说也是挑战最大的。所以也导致了各地方政府对于这类数据开放的程度、颗粒化细化程度和开放时间的步调会形成比较大的差异。
随着隐私计算技术的推广和被信任,“数据二十条”等政策的发布,越来越多的行业标准和测评认证机构给予隐私计算技术以肯定,隐私计算势必会逐步改善这件事情,但是从进展来说政府数据开放的进度仍远远落后于商业化数据开放的进度。
5、如果隐私计算普及,断直连模式是否可以取消掉?
刘新海:断直连的初衷是想解决个人隐私保护以及网络信息安全问题。如果有技术手段把这两个问题解决了,监管放心,社会放心,银行也放心。所以大家尝试隐私计算,但其基础设施建设不是一时半会可以完成的。目前征信机构还有很大问题,作为新生机构,它们的服务能力跟不上,同时也伴随着监管问题,建议隐私计算厂商可以往征信方向尝试。
隐私计算还有两大问题也不能忽视,第一个是效率,隐私计算数据处理效率问题亟待解决。另外一个问题是隐私计算需要配套机制。此外还包括大众对隐私计算的认知,新技术要想完全推广应用不是特别容易的事情,特别是这类非常前沿、有挑战性的技术。
6、在数据跨境上,隐私计算有哪些应用或尝试?
姚明:基于隐私计算技术的数据跨境,洞见科技在2020年就已开始尝试。从技术上来说已经具备了商业化条件,但依然会受政策性因素的困扰。
目前很多企业实行报备机制,比如报备哪些数据要离境,数据要用于什么目的等等。从监管的视角来看,企业是不是如自己所宣称、报备的那样,输出数据和报回数据内容是一致的,这实际上是一个监管问题。应用隐私计算技术,并给出一些方案和探索实践,主要是从监管这个角度来说。在数据可用不可见的情况之下,去验证这些企业所宣称的与实际的行动结果是否一致,是否符合国家政策法规的要求,仍需要隐私计算厂商继续去做探索和实践。
刘新海:通过研究全球征信,我发现其实在没有隐私计算之前,数据跨境早就实现了,比如欧美之间的通商数据早就跨境了,人都可以流动、数据自然也跟着动了。具体的例子像欧盟一体化,它的征信数据是可以跨境流动的,他们当时是在机制的设计下就搞成了,那是十年前的事,当时还没有隐私计算。
现在有了隐私计算技术,我觉得会更好。目前粤港澳大湾区数据、征信为什么推不动,最重要的问题是没有一个非常强有力的“领导”,当然监管也需要有人来推动。另外隐私计算技术在国内要想大量应用,需要一步一步地推广,一步一步地解决跨境问题、征信问题、AI问题以及数据孤岛的问题。
7、通用隐私计算技术的出现,是隐私计算最后的突破?
姚明:这是个技术问题。没有万能的技术只有万能的方案,方案是对技术的拼接和对技术本身的重组和重构。
隐私计算技术所谓的流派之争,并不是在商业化实践层面,更多是在学术层面有争议。商业化实践的层面更多围绕行业的一个领域、客户的具体需求给出最优解决方案,这个方案包括技术本身,也包括它的商业性价比,这其实才是真正推动一项技术快速迭代和产生大规模应用的出发点。
我们当然希望有理想化的技术可以解决全部的问题,理论上来说,密码学、同态加密等这些技术的组合可以解决绝大部分技术场景的问题,但是因为计算复杂度、性能、网络带宽消耗等问题,导致在商业化的过程中遇到了各式各样的问题,无法真正取得大量商业案例的落地,这才有了大家去研发新的、更轻量化的技术体系。
从我的角度来看,通用型技术就是一套融合引擎。刚才谈到ChatGPT,它并不是一个技术而是一类技术,仅仅靠着一类技术仍然不能够去开发出超级人工智能模型,还需要喂进去大量的数据,这正好补充了一点,对数据跨境,摆在面前最实际的问题就是ChatGPT需要数据喂它的时候,如果你用的是境外的ChatGPT,可能数据就已经出境了。
前几天有很多国家,包括国内的一些机构,在讨论要不要断掉ChatGPT现阶段的使用或者限制,说明一项技术即使通用也可能产生很多意想不到的负面东西,所以需要综合更多的技术,或者更多的方案才能变成让各方都满意的解决方案。在我看来,ChatGPT在不远的将来也会引入隐私计算等技术,堵上当前数据泄露或者隐私泄露的“坑”。
吴凡:通用取决于从哪个角度去看,对于厂商和供应方来讲,我认为是不可能通用的。目前隐私计算的技术框架有3种,即依赖硬件的可信执行环境,依赖密码学的MPC及同态加密,依赖人工智能的联邦学习,这些技术路径不可能通用。
但是从用户的角度讲,最终肯定是通用的,因为用户最终只看到一个结果——是不是计算效率够高、是不是算力很少、是不是能达到精确的计算结果。这是锘崴科技,乃至整个行业努力的一个方向,即用各种各样不通用的技术方式,最终达到给用户通用的结果和感受。
8、“数据二十条”对隐私计算的落地有哪些助推作用?
刘新海:国家数据局的组建,意在促进数据的应用,以及促进数据的集中管理。未来的职能仍有待观察,对隐私计算肯定有促进作用,但是不能期望太高。在研究数据的过程中,我发现有些理念跟现代实际的体量以及应用的生态是不匹配的。大家不能只依靠国家来出政策,而是需要行业、智库以及各方力量共同推进。
9、隐私计算未来要想快速发展,最重要的三件事是什么?
吴凡:第一个最想干的事是把《隐私计算:数字经济新基建》 这本书读完。第二,希望更多拥有数据的人可以了解隐私计算这项技术,并且信任这项技术。第三,希望行业对技术供应方案的要求更严苛些,倒逼业内真正有技术实力的公司和人才脱颖而出,如果说行业需求始终局限在level100,那就没有办法真正检验出拥有level500技术能力的公司,希望这个时刻尽快的到来。
姚明:集中精力做好一件事,那就是不断地去打磨从底层技术研发到服务客户的完整体系,给客户简单、易用、好用的产品服务体系。
刘新海:ChatGPT的巨大成功逼出来一个大招,类似的模式是不是能用到隐私计算中,比如产学研的整合。拿征信来说,央行征信中心每年有大量的经费,这些是否可以投入到大规模的应用上,用最顶尖的人才,年轻人挂帅,把这种研发的机制学过来,对隐私计算将来的突破,以及真正实现新型基础设施建设,是非常重要的。
柏亮:零壹智库在与业内机构、金融机构及地方政府的沟通中发现,大家对隐私计算有很强的实践需求,但同时这项技术的普及程度也确实不够。在此,零壹智库诚挚邀请在座的各位嘉宾及相关机构和数字经济各个领域的前沿创新机构,一起去推动隐私计算发展,以更高的效率、更低的成本去推动科研创新在经济、实践领域的应用。
End.